home *** CD-ROM | disk | FTP | other *** search
/ SGI Developer Toolbox 6.1 / SGI Developer Toolbox 6.1 - Disc 4.iso / src / exampleCode / speech / lackey / README < prev    next >
Encoding:
Text File  |  1994-08-02  |  5.8 KB  |  136 lines

  1.  
  2.                 THIS CODE RUNS/COMPILES ON 5.1 Irix OR LATER 
  3.                 THIS CODE WILL NOT RUN ON LESS THAN 5.1 Irix
  4.  
  5.        THIS DEMO IS BUILT WITH PRE-RELEASED DIGITAL MEDIA LIBRARY CODE.
  6.        THE API AND FUNCTIONALITY ARE SUBJECT TO CHANGE.  THE FINAL 
  7.        RELEASED VERSIONS OF THE DIGITAL MEDIA LIBRARIES WILL BE 
  8.        AVAILABLE AT THE END OF THIS YEAR BY ORDERING THE DIGITAL MEDIA 
  9.        LIBRARY DEVELOPMENT OPTION, "SC4-DEMDEV-1.2".
  10.  
  11.        THE SPEECH RECOGNITION DEVELOPER TOOLKIT IS AVAILABLE FROM:
  12.                   SCOTT INSTRUMENTS CORP.
  13.                   1111 WILLOW SPRINGS DRIVE
  14.                   DENTON, TX  76205
  15.                   TEL (817) 387-9514
  16.                   FAX (817) 566-3174
  17.  
  18. ______________________________________________________________________________
  19.  
  20.  
  21.             ~4Dgifts/toolbox/src/exampleCode/speech/lackey README
  22.  
  23.  
  24.                                                               mags  04.04.94
  25.       
  26.       lackey
  27.  
  28.       This is a speech recognition application example.  It recognizes 
  29.       speech through the use of a speech recognition library.  The 
  30.       example uses speech to launch desktop applications.  Lackey has an
  31.       internal list of "words" (words to be recognized) and their 
  32.       corresponding applications to be launched.  Saying one of these 
  33.       words causes the execution of that application .  The current set
  34.       of commands recognize by lackey are clock, shell, apanel, and 
  35.       lackey, which can easily be extended.
  36.  
  37.       An audio capable system (Indigo, Indigo2, Indy) and a microphone are
  38.       required.
  39.       
  40.       This example program was developed using SGI's speech recognition 
  41.       software.  This is an introduction to using the speech C++ API and 
  42.       the architecture of the speech software system.
  43.  
  44.   INSTALLATION:
  45.  
  46.       Before you can begin using this application you must update your 
  47.       system software to include the speech components.  Included on this
  48.       edition of the Developers Toolbox are the inst modules for the speech
  49.       execution and developer subsets.  When installed will update your
  50.       system with the speech DSO for your Xserver, the speech templates for
  51.       existing applications (such as Showcase), sounds and images, the speech
  52.       client library, include files, and sample programs.
  53.       
  54.       The speech server is part of the Xserver.  Therefore, to activate 
  55.       the speech recognition restart your Xserver by logging out of 
  56.       your current session.
  57.  
  58.       After you are logged back into your active session, start the 
  59.       Speech Recognition panel  :
  60.  
  61.           % srpanel &
  62.  
  63.  
  64.   STARTING lackey:
  65.  
  66.       Be sure to set your apanel settings as follows:  
  67.        Input sampling rate at 8khz, the input device to microphone and
  68.        the input level to 10.  
  69.  
  70.       Now you can start lackey
  71.  
  72.           % lackey &
  73.  
  74.  
  75.   TRAINING THE WORDS:
  76.  
  77.       None of the words that lackey will react to are known to the speech system
  78.       You mustyou must train the recognizer to recognize them.  Because this is 
  79.       a speaker independent system, the more different people that train the
  80.       words, the better the recognizer will get at recognizing variances in
  81.       the different speakers that use the system.  Since you have 
  82.       never trained the words to be recognized by the lackey program 
  83.       the speech recognition panel will prompt you to train each of 
  84.       these new words one at a time.  This will be denoted by a picture 
  85.       of a cat in the image window of the srpanel.  Make sure the 
  86.       microphone at least 12 inches away from you.  Slowly repeat the 
  87.       word (displayed prompt window of srpanel) at a normal tone until the 
  88.       word is recognized (at a minimum this will take 4 samples).  You will see
  89.       (1/4) near the word being trained.  This represents that one of four 
  90.       valid samples have collected.  Keep repeating the word until all four
  91.       samples have been collected.  Repeat this process for the rest of the
  92.       words in lackeys vocabulary.  If this process some how aborts or fails, 
  93.       you can use the Customization panel found in the srpanel's 
  94.       Recognizer pulldown menu.
  95.  
  96.  
  97.       Features of SGI's upcoming release of speech technology:
  98.  
  99.         - speaker-independent discrete-utterance recognition
  100.                 - quick response (less than 200 msecs)
  101.                 - medium-sized vocabularies (50 active words at a time)
  102.                 - no extra hardware required
  103.         - server-based
  104.                 - supports multiple speech application clients
  105.                 - supports networked speech application clients
  106.                 - handles focus policies for speech application clients
  107.                 - dispatches recognition events
  108.                 - audio samples processed only once by central server
  109.                   (for computational efficiency)
  110.         - pretrained words and phrases
  111.         - a suite of selected applications that are "speech-aware"
  112.                 - CASE tools
  113.                 - Showcase
  114.                 - Desktop
  115.         - a vocabulary development system that allows the user to add,
  116.                 modify, and delete the words which can be recognized
  117.         - a control panel through which the user can set behavioral
  118.           characteristics such as the acceptance and rejection thresholds
  119.         - a tool to generate actions for applications that are not
  120.                 "speech aware" (not listening for speech input)
  121.         - documentation
  122.  
  123.       SGI's developers product for speech-applications also feature:
  124.  
  125.         - and API implemented with C and C++ speech headers & libraries
  126.         - advanced vocabulary development tools
  127.         - a database of pretrained words and phrases
  128.         - documentation
  129.                 - programmers' guide
  130.                 - API specification
  131.                 - policy (style) guide for developing speech application
  132.                   behavior and vocabularies
  133.  
  134.  
  135.  
  136.